#### Citation

(Translation of Filing particulars and Abstract)

Japanese Patent Application Laying Open (KOKAI) No. 10-124316 laid open to the public May 15, 1998

Japanese Patent Application No. 9-230976 filed August 27, 1997

Applicant(s): Matsushita Electric Industrial Co., Ltd., Osaka, Japan

Inventor(s): Kozo KIMURA et al., Japanese citizens

Title of Invention: MULTITHREAD PROCESSOR INDEPENDENTLY PROCESSING
PLURAL INSTRUCTION FLOWS AND FLEXIBLY CONTROLLING
PROCESSING PERFORMANCE BY THE SAME INSTRUCTION
FLOWS

Patent Family: EP 827071, US 6105127 and others

#### PATENT ABSTRACTS OF JAPAN

(11) Publication number:

10-124316

(43) Date of publication of application: 15.05.1998

(51) Int.CI.

G06F 9/38

G06F 9/38

(21) Application number: 09-230976 (71) Applicant: MATSUSHITA

ELECTRIC IND CO

LTD

(22) Date of filing: 27.08.1997 (72) Inventor: KIMURA KOZO

KIYOHARA TOKUZO

YOSHIOKA KOSUKE

(30) Priority

Priority

08224720

Priority 27.08.1996

Priority JP

number:

date:

country:

(54) MULTITHREAD PROCESSOR INDEPENDENTLY PROCESSING PLURAL INSTRUCTION FLOWS AND FLEXIBLY CONTROLLING PROCESSING PERFORMANCE BY THE SAME INSTRUCTION FLOWS

## (57) Abstract:

PROBLEM TO BE SOLVED: To provide a multithread processor which dynamically realizes the processing performance needed by instruction flows and to improves the total throughput. SOLUTION: This processor is equipped with instruction decoding parts 1 to 3 which decode instructions, specify function units to execute the instructions, and output instruction issue requests, a priority control part 60 which controls the priority levels of instruction flows that can be set by the instruction flows with instructions in the instruction flows, and an instruction issue arbitration part 40 which determines instructions to be issued to the function units according to the priority when more than one instruction decoding part output instruction issue requests to one function unit. Consequently, the processing performance needed by the instruction flows can dynamically and properly be actualized and the total throughput can be improved.

Copyright (C); 1998,2003 Japan Patent Office

Fig. 3

[図3]

Fig. 4

| 31 29 28 |          | 12 11 9 | 8 6  | 5 3  | 2 0   |
|----------|----------|---------|------|------|-------|
| MYID     | reserved | PR13    | PR12 | PRII | MYPRI |
| 210      |          | 223     | 252  | 221  | 220   |

| PRIx [1:0] | 意味      |
|------------|---------|
| 00         | lowest  |
| 01         | middle  |
| 10         | highest |
| 11         | highest |

【図4】





Fig. 5



Fig. 6

| PRIx [2] | 意味   | ]        | 【図6】     | ·           |
|----------|------|----------|----------|-------------|
| 0        | 実行状態 | ]        | (MO)     |             |
| 1        | 停止状態 | 31 29 28 |          | 3 2 1 0     |
| ·•       |      | MYID     | reserved | IR3IR2IR1   |
|          |      | 310      |          | 322 321 320 |

Fig. 7

[図7]

| 31 29 28 |          | 3 2 1 0           |
|----------|----------|-------------------|
| MYID     | reserved | EXCL3 EXCL2 EXCL1 |
| 410      |          | 422 421 420       |

Fig. 8

【図8】

Fig. 12

【図12】



| 命令           | 機能ユニットBの実行内容                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        |
|--------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| inc pri      | スーパーパイザモードのとき:PRlx [1] ← 1<br>1-ザモードのとき:PRlx [0] ← 1                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                |
| dec pri      | スーパーバイザモードのとき:PRIx [1] ← 0<br>ユーザモードのとき:PRIx [0] ← 0                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                |
| halt         | PRIx [2] ←1                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         |
| exc2A        | EXCLx ← 1<br>EXCLy ← 0                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              |
| retex        | EXCLx ← 0                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           |
| mov PRI.R0   | x = 3 0 ≥ £ R0 [31 : 29] ← 100(for MYID)<br>x = 2 0 ≥ £ R0 [31 : 29] ← 010(for MYID)<br>x = 1 0 ≥ £ R0 [31 : 29] ← 001(for MYID)<br>R0 [11 : 3] ← IR] [1:3] |
| mov IR,R0    | x = 3 0 t                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           |
| mav EXCL,,Rû | x = 3 0 t t R0 [31 : 29] + 100(far MYID)<br>x = 2 0 t t R0 [31 : 29] + 010(far MYID)<br>x = 1 0 t t R0 [31 : 29] + 001(far MYID)<br>R0 [2 : 0] + IR[2:0](=EXCL3,EXCL2,EXCL1 t' +)                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   |

ただし、x は命令発行元の論理了吐が番号である。 y は命令発行元以外の各論理プロが番号である。

Fig. 9

【図9】



Fig. |0

【図10】

| (a) I      | PR1',     | >PR2 | '>PI | ₹3°Ø | 場合  |   | (ъ) 1     | PR1'=     | =PR2 | !'>P! | R3'0     | 場合 |   | (c) 1 | PRI', | >PRZ | ?'=P | R3'02 | 場合  |
|------------|-----------|------|------|------|-----|---|-----------|-----------|------|-------|----------|----|---|-------|-------|------|------|-------|-----|
|            | 入力        |      |      | 出力   |     |   |           | 入力        |      |       | 出力       |    |   |       | 入力    |      |      | 出力    |     |
| <u> 1A</u> | <u>2A</u> | 3A   | IA'  | 2A'  | 3A' |   | <u>1A</u> | <u>2A</u> | 3A   | 1A    | ZA       | 3A | ' | IA    | ZA    | JA   | 1A'  | 4A    | JA. |
| 1          | 1         | 1    | 1    | 0    | 0   | ' | 1         | 1         | 1    | 1     | <u>.</u> | 0  |   | 1     | 1     | 1    | 1    | 0     | 0   |
| 1          | 1         | 0    | 1    | 0    | 0   |   | 1         | 1         | 0    | 1.    | J.       | 0  |   | 1     | 1     | 0    | 1    | 0     | 0   |
| 1          | 0         | 1    | 1    | 0    | 0   |   | 1         | 0         | 1    | 1     | 0        | 0  |   | 1     | 0     | 1    | ı    | 0     | Ò   |
| 1          | 0         | 0    | 1    | 0    | 0   |   | 1         | 0         | 0    | 1     | 0        | 0  |   | 1     | 0     | 0    | 1    | 0     | 0   |
| 0          | 1         | 3    | 0    | 1    | 0   |   | 0         | 1         | 1    | 0     | 1        | 0  |   | 0     | ı     | 1    | 0    | 1     | ᆚ   |
| 0          | 1         | 0    | 0    | 1    | 0   |   | 0         | 1         | 0    | 0     | 1        | 0  |   | 0     | 1     | 0    | 0    | 1     | 0   |
| 0          | 0         | 1    | 0    | 0    | 1   |   | 0         | 0         | 1    | 0     | 0        | 1  |   | 0     | 0     | 1    | 0    | 0     | 1   |
| 0          | 0         | 0    | 0    | 0    | 0   |   | 0         | 0         | 0    | 0     | 0        | 0  |   | 0     | 0     | 0    | 0    | 0     | 0   |

Fig. ||

【図11】



Fig. 13.

【図13】



Fig. 14

[図14]

| 選択  | 信号 | t          | レクタ 68の出    | b           |
|-----|----|------------|-------------|-------------|
| 特定命 |    | PRI3 [1:0] | PRI2' [1:0] | PRII' [1:0] |
| =0  | _  | PR13 [1:0] | PRI2 [1:0]  | PRT1 [1:0]  |
|     | 3  | 11         | 00          | 00          |
| ≠0  | 2  | 00         | 11          | 00          |
|     | 1  | 00         | 00          | 11          |

Fig. 19

[図15]



(19)日本国特許庁 (JP)

(12) 公開特許公報(A)

(11)特許出願公開番号

特開平10-124316

(43)公開日 平成10年(1998) 5月15日

(51) Int.CL.8 G06F 9/38 識別配号 370 310

FΙ G06F 9/38

370A 310F

#### 審査請求 未請求 請求項の数38 OL (全 21 頁)

(21)出願番号

特勝平9-230976

(22)出顧日

平成9年(1997)8月27日

(31) 優先権主張番号 特願平8-224720

(32)優先日

平8 (1996) 8 月27日

(33)優先權主張国

日本 (JP)

(71)出廣人 000005821

松下電器産業株式会社

大阪府門真市大字門真1006番地

(72)発明者 木村 浩三

大阪府門真市大字門真1006番地 松下電器

**産業株式会社内** 

(72)発明者 清原 督三

大阪府門真市大字門真1006番地 松下電器

**産業株式会社内** 

(72)発明者 吉岡 康介

大阪府門真市大字門真1006番地 松下電器

産業株式会社内

(74)代理人 弁理士 中島 司朗

(54) 【発明の名称】 複数の命令流を独立に処理し、命令流単位に処理性能を柔軟に制御するマルチスレッドプロセッ.

#### (57)【要約】

【課題】 本発明は、命令流単位に必要とされる処理性 能を動的に実現し、かつ全体の処理効率を向上させたマ ルチスレッド・プロセッサを提供することを目的とす

【解決手段】 命令を解読して当該命令を実行すべき機 能ユニットを指定して命令発行要求を出力する複数の命 令解読部1~3と、命令流中の命令によって命令流毎に 設定可能な、命令流の優先順位を制御する優先順位制御 部60と、一の機能ユニットに対して二以上の命令解読 部から同時に命令発行要求が出力された場合に、当該機 能ユニットに発行すべき命令を前記優先度に従って決定 する命令発行調停部40とを備える。との構成によれ ば、命令流毎に必要とされる処理性能を動的に適切に実 現し、かつ全体の処理効率を向上させることができる。



20

#### 【特許請求の範囲】

【請求項1】 複数の命令流を実行するマルチスレッド プロセッサであって、

それぞれ命令を実行する複数の機能ユニットと、 命令流に対応して設けられ、それぞれ命令を解読して、 当該命令を実行すべき機能ユニットを指定するとともに 当該機能ユニットに解読された命令を発行すべきことを 要求する命令発行要求を作成する複数の命令解読手段

命令流毎に命令流の優先度を保持する保持手段と、 2以上の命令発行要求が同時に一の機能ユニットを指定 している場合に、保持手段に保持された優先度に従っ て、当該機能ユニットに発行すべき解読された命令を決 定する制御手段とを備えることを特徴とするマルチスレ ッドプロセッサ。

【請求項2】 前記保持手段は、さらに、命令によって 設定可能な、命令流毎に命令流を停止すべきか実行すべ きかを示すフラグ群を保持し、

前記制御手段は、

前配決定を行う關停手段と、

停止を示すフラグが設定されている場合には、そのフラ グに対応する命令流の命令発行要求を除外して前記決定 を行うことにより、当該命令流を停止する停止手段とを 備えることを特徴とする請求項1記載のマルチスレッド プロセッサ。

【請求項3】・前記制御手段は、さらに何れかの命令流 に対して緊急を要する処理が発生した場合に、当該命令 流に属する命令であって前記制御手段において発行すべ きであると決定された命令について、機能ユニットへの 命令発行を一時的に禁止する禁止手段を備えることを特 30 徴とする請求項2記載のマルチスレッドプロセッサ。

【請求項4】 前記緊急を要する処理は、割込み要求、 キャッシュミス発生を知らせるイベントの何れかである ことを特徴とする請求項3記載のマルチスレッドプロセ

【請求項5】 機能ユニットの1つは、優先度の変更を 指示する専用命令を受け、保持手段に保持された優先度 のうち、当該専用命令が属する命令流の優先度を変更す ることを特徴とする請求項1記載のマルチスレッドプロ セッサ。

【請求項6】 前記専用命令は、優先度を上げ又は下げ ることを指示するオペレーションコードのみからなり、 前記機能ユニットの1つは、専用命令の解読結果が発行 された場合、当該専用命令を発行した命令解読手段を判 別して、判別された命令解説手段に対応する命令流の優 先度を上げ又は下げることを特徴とする請求項5記載の マルチスレッドプロセッサ。

【請求項7】 前記保持手段は、読み出し専用の第1フ ィールドを有する制御レジスタを含み、

令の解読結果が発行された場合、当該読み出し命令を発 行した命令解読手段を判別して、当該命令解読手段に対 応する命令流の I Dを第1フィールドの読み出しデータ として内部バス上に出力することを特徴とする請求項6 記載のマルチスレッドプロセッサ。

【請求項8】 前記制御レジスタは、さらに前記優先度 を保持するための命令流毎の優先度フィールドを有し、 前記機能ユニットの1つは、制御レジスタの読み出し命 令の解読結果が発行された場合、さらに各優先度フィー 10 ルドを読み出すことを特徴とする請求項7記載のマルチ スレッドプロセッサ。

【請求項9】 前配保持手段は、制御レジスタを有し、 前記制御レジスタは、さらに、命令流固有のデータを保 持するための命令流毎の個別フィールドと、読み出し専 用の第2フィールドとを有し、

前記機能ユニットの1つは、前記制御レジスタの読み出 し命令の実行に際して、さらに、命令流毎の個別フィー ルドを読みだすとともに、当該読み出し命令を発行した 命令解読手段に対応する命令流の固有のデータを第2フ ィールドの読み出しデータとして内部バス上に出力する ことを特徴とする請求項6記載のマルチスレッドプロセ ッサ。

【請求項10】 前配命令流固有のデータは、優先度で あることを特徴とする請求項9記載のマルチスレッドプ ロセッサ。

【請求項11】 前配保持手段は、命令流毎の優先度を 保持する優先度フィールドを有し、

前配優先度フィールドは、命令流の実行モード別の優先 度を示す小フィールドからなり、

前記機能ユニットの1つは、専用命令の解読結果が発行 された場合、当該専用命令を発行した命令解読手段を判 別して、判別された命令解読手段に対応する命令流の優 **先度フィールドのうち現在の実行モード用の小フィール** ドの優先度を上げ又は下げることを特徴とする請求項6 記載のマルチスレッドプロセッサ。

【請求項12】 機能ユニットに1つが特定の命令を実 行開始したことと、当該特定命令の解読結果をどの命令 解読手段が発行したかを検出する特定命令検出手段と、 特定命令の実行開始が検出されたとき、その特定命令を 40 発行した命令解読手段に対応する命令流の優先度を、他 の命令流よりも高い優先度に予め定められた期間一時的 に変更する一時変更手段とを備えることを特徴とする讚 求項1記載のマルチスレッドプロセッサ。

【請求項13】 複数の命令流を実行するマルチスレッ ドプロセッサであって、

それぞれ命令を実行する複数の機能ユニットと、 命令流に対応して設けられ、それぞれ命令を解読して、 当該命令を実行すべき機能ユニットと、当該機能ユニッ トに解読された命令を発行すべきことを要求する命令発 前記機能ユニットの1つは、制御レジスタの読み出し命 50 行要求を作成する複数の命令解読手段と、

命令流毎にその優先度を保持する優先度保持手段と、 命令流毎に命令流を実行状態にすべきか停止状態にすべ きかを示す自己停止データを保持する自己停止データ保 持手段と、

複数の命令解読部から通知される命令発行要求を受け て、2以上の命令発行要求が同時に一の機能ユニットを 指定している場合に、優先度保持手段に保持された優先 度に従って、当該機能ユニットに発行すべき解読された 命令を決定する調停手段と、

行要求のうち、前記自己停止データにより停止状態とさ れている命令流に対応する命令解読部から調停手段への 命令発行要求の選知を停止する停止手段とを備えること を特徴とするマルチスレッドプロセッサ。

【請求項14】 前記マルチスレッドプロセッサは、さ らに命令流毎に他の命令流を排他的に停止状態にすべき か否かを示す排他停止データを保持する排他停止データ 保持手段を備え、

前記停止手段は、さらに前記排他停止データにより停止 状態とされている命令流に対応する命令解読部から調停 20 手段への命令発行要求の通知を停止することを特徴とす る請求項13記載のマルチスレッドプロセッサ。

【請求項15】 前記機能ユニットの1つは、優先度の 変更を指示する専用命令の解読結果が発行された場合、 当該命令に従って優先度を変更することを特徴とする請 求項13記載のマルチスレッドプロセッサ。

【請求項16】 前記専用命令は、優先度を上げる又は 下げることを指示するオペレーションコードのみからな

された場合、当該専用命令を発行した命令解読手段を判 別して、判別された命令解読手段に対応する命令流の優 先度を上げ又は下げるととを特徴とする請求項15記載 のマルチスレッドプロセッサ。

【請求項17】 前記保持手段は、読み出し専用の第1 フィールドを有する制御レジスタを含み、

前記機能ユニットの1つは、制御レジスタの読み出し命 令の解読結果が発行された場合、当該読み出し命令を発 行した命令解読手段を判別して、当該命令解読手段に対 応する命令流のIDを第1フィールドの読み出しデータ 40 読手段と、 として内部バス上に出力することを特徴とする請求項1 8記載のマルチスレッドプロセッサ。

【請求項18】 前記制御レジスタは、さらに前記優先 度を保持するための命令流毎の優先度フィールドを有 し、

前記機能ユニットの1つは、制御レジスタの読み出し命 令の解読結果が発行された場合、さらに各優先度フィー ルドを読み出すことを特徴とする請求項17記載のマル チスレッドプロセッサ。

【請求項19】 前配保持手段は、制御レジスタを有

前記制御レジスタは、さらに、命令流固有のデータを保 持するための命令流毎の個別フィールドと、読み出し専 用の第2フィールドとを有し、

前記機能ユニットの1つは、前記制御レジスタの読み出 し命令の実行に際して、さらに、命令流毎の個別フィー ルドを読みだすとともに、当該読み出し命令を発行した 命令解読手段に対応する命令流の固有のデータを第2フ ィールドの読み出しデータとして内部バス上に出力する 複数の命令解読部から前記調停手段に通知される命令発 10 ことを特徴とする請求項16記載のマルチスレッドブロ

> 【請求項20】 前配命令流固有のデータは、優先度で あることを特徴とする請求項19記載のマルチスレッド プロセッサ。

> 【請求項21】 前配保持手段は、命令流毎の優先度を 保持する優先度フィールドを有し、

> 前記優先度フィールドは、命令流の実行モード別の優先 度を示す小フィールドからなり、

前記機能ユニットの1つは、専用命令の解読結果が発行 された場合、当該専用命令を発行した命令解読手段を判 別して、判別された命令解読手段に対応する命令流の優 先度フィールドのうち現在の実行モード用の小フィール ドの優先度を上げ又は下げることを特徴とする請求項1 9記載のマルチスレッドプロセッサ。

【請求項22】 機能ユニットに1つが特定の命令を実 行開始したことと、当該特定命令の解読結果をどの命令 解読手段が発行したかを検出する特定命令検出手段と、 特定命令の実行開始が検出されたとき、その特定命令を 発行した命令解読手段に対応する命令流の優先度を、他 前記機能ユニットの1つは、専用命令の解読結果が発行 30 の命令流よりも高い優先度に予め定められた期間―時的 に変更する一時変更手段とを備えることを特徴とする請 求項13記載のマルチスレッドプロセッサ。

> 【請求項23】 複数の命令流を同時かつ独立に並列実 行するマルチスレッドプロセッサであって、

> それぞれ同時かつ独立に命令を実行する複数の機能ユニ ットと、

> 前配複数の命令流の対応して設けられる、それぞれは命 令流の命令を取り出して解読し、前記機能ユニットのう ち発行先とすべき機能ユニットを特定する複数の命令解

> 前記複数の命令流毎の優先度を指定する優先度指定手段

命令を受け入れ可能か否かを示す機能ユニット毎の状態 に基づいて、前記発行先とすべき機能ユニットに、解読 された命令を発行可能か否かを判断する命令発行判断手 段と、

一の機能ユニットに対して二以上の命令が発行可能と判 断された場合には、前記優先度指定手段に指定される優 先度に従って当該二以上の命令を調停して当該一の機能 50 ユニットに発行すべき一命令を決定する命令発行調停手 段とを備えることを特徴とするマルチスレッドプロセッ

【請求項24】 マルチスレッドプロセッサは、さらに どれかの命令流に対して緊急を要する処理が発生した場 合に、当該命令流に属する命令であって前記命令発行調 停手段において既に発行すべきであると決定された命令 について、機能ユニットへの命令発行を一時的に禁止す る命令発行禁止手段を備えることを特徴とする請求項2 3記載のマルチスレッドプロセッサ。

【請求項25】 前記緊急を要する処理は、割込み要 求、キャッシュミス発生を知らせるイベントの何れかで あるを備えることを特徴とする請求項24記載のマルチ スレッドプロセッサ。

【請求項26】 前記優先度指定手段は、命令流毎に命 令流の優先度を保持する制御レジスタを備え、

前記優先度は、命令流中の命令によって設定されること を特徴とする請求項24記載のマルチスレッドプロセッ

【請求項27】 前記機能ユニットの1つは、優先度の 優先度のうち、当該専用命令が属する命令流の優先度を 変更することを特徴とする請求項26記載のマルチスレ ッドプロセッサ。

【請求項28】 前記命令発行調停手段は、さらに一の 機能ユニットに対して二以上の命令が発行可能と判断さ れ、かつ、当該二以上の命令が属する命令流が同順位の 優先度である場合には、当該一の機能ユニットに発行す べき命令を所定の手順で決定することを特徴とする請求 項27記載のマルチスレッドプロセッサ。

【請求項29】 前配命令発行調停手段は、前配所定の 30 ジスタと、 手頭として、周期的に異なる命令流が優先されるように 決定する手順と、命令流の実行の履歴より前回と異なる 命令流の命令を発行すべき命令と決定する手順と、固定 的に何れかの命令流の命令を決定する手顧との何れかに 従って発行すべき命令を決定する補助判定手段を備える ことを特徴とする請求項28記載のマルチスレッドプロ

【請求項30】 前配制御レジスタは、命令流毎に実行 モード別の優先度フィールドを有し、

前配命令発行調停手段は、命令流の実行モードに応じた 40 優先度フィールドを参照して前記調停を行うことを特徴 とする請求項28記載のマルチスレッドプロセッサ。

【請求項31】 前配優先度指定手段は、

命令流中の専用命令によって命令流毎に実行モード別の 設定可能な優先度フィールドを有する制御レジスタを備

機能ユニットの1つは、前配専用命令の発行元の命令解 競手段に対応する命令流及びその実行モードを検出し

て、検出された命令流及び実行モードに対応する優先度 フィールドに専用命令に従って優先度を設定することを 50 サ。

特徴とする請求項24記載のマルチスレッドブロセッ サ.

【請求項32】 前記専用命令は、オペレーションコー ドのみからなり、優先度の上昇又は下降の何れかを指示 することを特徴とする請求項31記載のマルチスレッド プロセッサ。

【請求項33】 複数の命令流を同時かつ独立に並列実 行するマルチスレッドプロセッサであって、

同時かつ独立に命令を実行する複数の機能ユニットと、 10 前記複数の命令流の対応して設けられる、命令流の命令 を取り出して解読し、前記機能ユニットのうち発行先と すべき機能ユニットを解読する複数の命令解読手段と、 前記複数の命令流毎の優先度と、命令流毎に実行状態に あるか停止状態にあるかを指定する優先度指定手段と、 命令を受け入れ可能か否かを示す機能ユニット毎の状態 に基づいて、前記発行先とすべき機能ユニットに、解読 された命令を発行可能か否かを判断する命令発行判断手 段と、

一の機能ユニットに対して二以上の命令が発行可能と判 変更を指示する専用命令を受け、保持手段に保持された 20 断された場合には、前記優先度指定手段に指定される優 先度に従って当該二以上の命令を調停して当該一の機能 ユニットに発行すべき一命令を決定する命令発行調停手 段とを備えることを特徴とするマルチスレッドプロセッ **サ。** 

【請求項34】 前配優先度指定手段は、

第1の命令によって設定可能な命令流毎の優先度を保持 する第1レジスタと、

第2の命令によって設定可能な、命令流が実行状態か停 止状態かを示す命令流毎の状態フラグを保持する第2レ

第3の命令によって設定可能な、他の全命令流を停止す ることを示す命令流毎の排他停止フラグを保持する第3 レジスタとを備え、

前記命令発行判断手段は、前記状態フラグ及び排他停止 レジスタに従って停止中の命令流の命令を発行不可と判 断することを特徴とする請求項33記載のマルチスレッ ドプロセッサ。

【請求項35】 前記第1の命令は、優先度を上げる又 は下げることを指示するオペレーションコードのみから なる命令であり、

前記第2の命令は、停止状態に入るととを指示するオペ レーションコードのみからなる命令であり、

前記第3の命令は、他の命令流を停止させることを指示 するオペレーションコードのみからなる命令であり、

前記機能ユニットの1つは、第1、第2又は第3の命令 が発行されたとき、当該命令の発行元の命令解読手段に 対応する命令流を検出して、検出された命令流対応する 優先度、状態フラグ又は排他停止フラグを変更すること を特徴とする請求項34記載のマルチスレッドプロセッ

【請求項36】 複数の命令流を同時かつ独立に並列実 行するマルチスレッドプロセッサであって、

前記複数の命令流の命令を一時記憶する命令キャッシュ

前記複数の命令流に対応して設けられ、命令キャッシュ から命令流の命令をフェッチする複数の命令フェッチ手 段と.

前記複数の命令流毎に優先度を指定する優先度指定手段

求が出された場合には、前配優先度制御回路の優先度に 従って、命令フェッチ要求を調停する命令フェッチ制御 手段とを備えることを特徴とするマルチスレッドプロセ

【請求項37】 命令を実行する複数の機能ユニット と、命令キャッシュから命令を取り出して解読し当該命 令を実行すべき機能ユニットを指定して命令発行要求を 出力する複数の命令解読部と、命令解読部と同数のレジ スタセットを有し、命令解読部と同数の複数の命令流を 同時かつ独立に実行するマルチスレッドプロセッサであ 20 って.

命令流中の命令によって命令流毎に設定可能な、命令流 の優先度を保持する保持手段と、

複数の命令流によって共有される資源に対して、二以上 の命令流が同時に競合した場合に、前記優先度に従って 調停する制御手段とを備え、

前記共有資源に対する競合は、一の機能ユニットに対す る二以上の命令解読部からの命令発行要求の競合、命令 キャッシュに対する二以上の命令解読部からの命令取り 出し要求の競合、一のレジスタセットに対する二以上の 30 機能ユニットからのアクセス要求の競合の何れかである ことを特徴とするマルチスレッドプロセッサ。

【請求項38】前記機能ユニットの1つは、優先度を上 げる又は下げることを指示する命令を受け、保持手段に 保持された優先度のうち当該命令が属する命令流の優先 度を変更することを特徴とする請求項36記載のマルチ スレッドプロセッサ。

#### 【発明の詳細な説明】

[0001]

【発明の属する技術分野】本発明は複数の命令流から命 40 令を並列に発行することによって、複数の演算ユニット を効率よく使用する情報処理装置に関する。

[0002]

【従来の技術】従来例としては、一つのブロセッサ内で 複数の命令流を同時に処理するマルチスレッド・プロセ ッサがある。マルチスレッド・プロセッサの方式につい ては、"A Multithreaded Processor Architecture with Simultaneous Instruction Issuing," In Proc. of IS S'91:International Symposium on Supercomputing, Fu られている。

【0003】図15は、との従来例のマルチスレッドプ ロセッサの構成を示すプロック図である。同図におい て、マルチスレッドプロセッサは、命令キャッシュ50 0、3個の命令フェッチユニット501、3個の解読ユ ニット502、12個のスタンバイステーション50 3、4個の命令スケジューリングユニット504、4個 の機能ユニット505、レジスタセット506を備え、 同図における命令フェッチユニットと命令解読ユニット 二以上の命令キャッシュ手段から同時に命令フェッチ要 10 との組みに対応する3つの命令流を同時に独立して実行 するよう構成されている。ととで命令流とは、命令フェ ッチユニットと命令解読ユニットとの組みによる処理の 流れに対応する。

> 【0004】同図において、命令フェッチユニット50 1は、それぞれ異なる命令流の命令を命令キャッシュ5 00から読み込む。解読ユニット501は、それぞれの 命令流の命令を解読し、当該命令を処理可能な機能ユニ ット505に接続されているスタンパイステーション5 03に命令の解読結果(以下単に命令という)を格納す ろ.

> 【0005】命令スケジューリングユニット504は、 スタンパイステーション503から適当な命令を選択 し、空いている機能ユニット505に送る。一の機能ユ ニットに対する異なる命令流の命令解読結果がスタンパ イステーション503に格納されている場合には、固定 的な順番で命令が選択される。とれにより命令流間の公 平が図られている。

> 【0006】機能ユニット505は、それぞれ命令を実 行する演算器であり、スタンパイステーション503か ちの命令をレジスタセット506を用いて実行する。各 機能ユニットは同じものでよいが、例えばロード/スト アユニット、整数演算ユニット、浮動小数点演算ユニッ ト、乗除算ユニットなどの演算種類別に備える場合が多

【0007】上記のように構成されたマルチスレッド・ プロセッサにおいて、その動作を簡単に説明する。同図 のマルチスレッドプロセッサでは命令フェッチユニット 501と解読ユニット502とが三組み備えられている ので、3つの命令流を並列にフェッチ・解読することが できる。3つの命令流と命令キャッシュ500(又は図 外のメインメモリ)中のプログラムとの対応関係につい ては、1つのプログラムが1つの命令流に対応する場合 (3つのプログラムから3つの命令流が生成される場 合)や、1つのプログラムが複数の命令流に対応する場 合(1つのプログラムから3つの命令流が生成される場 合)などがある。後者は、例えば1つの画像処理プログ ラムを異なる画像データに対して同時に複数の命令流と して実行させる場合である。

【0008】解読ユニット502に解読された命令は、 kuoka, Japan, pp.87-96, November 1991 に詳細に述べ 50 スタンバイステーション503、命令スケジューリング

ユニット504を介して、当該命令に対応する機能ユニ ットに発行される。各機能ユニットは、どの命令流から の命令であっても発行された命令を実行する。とのよう に、マルチスレッド・プロセッサの特徴は、複数の命令 流を演算器を共有して同時に実行することである。

【0009】なお、マルチスレッド・プロセッサは一つ のプロセッサ内部で複数の命令流を扱うが、一つの命令 流を実行する単位を論理プロセッサと呼ぶことにする。 論理プロセッサは各々独立に命令流を扱えるように解読 などを有する。複数の論理プロセッサにより使用される 機能ユニットやキャッシュメモリなどは論理プロセッサ 間で共有される。

【0010】一方、論理プロセッサに対して全体のプロ セッサを物理プロセッサと呼ぶことにする。また、マル チスレッド・プロセッサと既存のスーパースカラ方式の プロセッサとを比べると、スーパースカラ・プロセッサ は、機能ユニットのみの多重化(複数化)がなされてい るため、同時に処理可能な命令流は1つであり、命令間 の依存関係によりパイプラインインタロックが頻繁に発 20 生し、その結果機能ユニットの使用効率は上がらず性能 向上が困難であった。とれに対して、上記のマルチスレ ッドプロセッサは、複数の命令流の命令を並列に実行す ることにより、各機能ユニットの使用効率を上げ、性能 向上を実現できる。

### [0011]

【発明が解決しようとする課題】しかしながら上記マル チスレッドプロセッサの構成では、下記の問題点を有し ていた。第1に、複数の論理プロセッサが機能ユニット を共有しているため、複数の命令流から発行される命令 30 が機能ユニットにおいて競合することがあり、このた め、ある一定の期間で、特定の論理プロセッサの命令発 行が他の論理プロセッサの命令発行に比べて極端に少な くなる場合があり、その特定の論理プロセッサの性能が 極端に低下するという問題がある。また、論理プロセッ サ間で負荷が大きく異なる場合には、各論理プロセッサ に同じ処理内容の(同一プログラムから生成される)命 令流を割り付けた場合であっても、特定の命令流だけ処 理が遅れることになり、処理の終了時間がばらつき、全 体として速度が上がらない場合も起とる。

【0012】第2化、論理プロセッサにそれぞれ異なる 命令流が割り付けられ、特定の命令流だけ早く実行した い場合が発生しても、特定の論理プロセッサの処理速度 を相対的に上げたり、命令キャッシュなどの共有資源を 占有してしまうことができないため、全体の性能が低下 してしまう。たとえば、緊急を要する割り込み処理など が発生した場合などがこれに当たる。

【0013】上記問題点に鑑み本発明の目的は、複数の 命令流間で各命令流の処理性能を柔軟に調整することが でき、かつ全体の処理効率を向上させたマルチスレッド 50 本発明と関係しないので説明を省略する。また、説明を

・プロセッサを提供することを目的とする。 [0014]

【課題を解決するための手段】上記目的を達成するマル チスレッドプロセッサは、それぞれ命令を実行する複数 の機能ユニットと、命令流に対応して設けられ、それぞ れ命令を解読して、当該命令を実行すべき機能ユニット を指定するとともに当該機能ユニットに解読された命令 を発行すべきことを要求する命令発行要求を作成する複 数の命令解読手段と、命令流毎に命令流の優先度を保持 ユニットや命令のシーケンス制御機構やレジスタセット 10 する保持手段と、2以上の命令発行要求が同時に一の機 能ユニットを指定している場合に、保持手段に保持され た優先度に従って、当該機能ユニットに発行すべき解読 された命令を決定する制御手段とを備えて構成される。 【0015】との構成によれば、各機能ユニットに発行 すべき命令(命令の解読結果)が前記優先度に従って決 定されるので、複数の命令流間で負荷のばらつきを優先 度に応じて柔軟に調整することができ、命令流毎に必要 とされる処理性能を適切に実現し、かつ全体の処理効率 を向上させることができるという効果がある。ここで前 記保持手段は、さらに、命令によって設定可能な、命令 流毎に命令流を停止すべきか実行すべきかを示すフラグ 群を保持し、前記制御手段は、前記決定を行う調停手段 と、停止を示すフラグが設定されている場合には、その フラグに対応する命令流の命令発行要求を除外して前記 決定を行うことにより、当該命令流を停止する停止手段 とを備えてもよい。

> 【0016】との構成によれば、さらに、命令流がその 実行過程においてアイドル状態や待ち状態にある場合に は、その命令流を停止状態とすることができる。つまり その結果、他の命令流を優先して実行させることができ るので、さらに全体の処理性能を向上させることができ る。

#### [0017]

#### 【発明の実施の形態】

<マルチスレッド・プロセッサの構成>図1は、本発明 の実施形態におけるマルチスレッド・プロセッサの主要 部の構成を示すブロック図である。本マルチスレッド・ プロセッサは、命令解読部1~3、機能ユニットA2 O、機能ユニットB21、機能ユニットC22、機能ユ 40 ニットD23、命令発行判断部30、命令発行調停部4 0、命令発行禁止部50、優先順位制御部60、命令選 択部70を有し、論理プロセッサの実行状態、命令流の 優先度及び外部要因に応じて各機能ユニットへの命令発 行を調停するように構成されている。

【0018】また、本マルチスレッド・ブロセッサは、 図15に示した命令キャッシュ、命令フェッチユニッ ト、レジスタファイルなどを当然に備えているが、従来 例と同じなので図1では省略している。同様に機能ユニ ットのパイプライン段数などの詳細な構成等についても

わかりやすくするために本実施形態では、各命令解読部 は命令流1個につき1命令を解読し、一度に発行できる 命令も1個であるものとする。

【0019】図1において、命令解読部1~3は、それでれ命令流の命令を解読し、解読結果として、命令発行判断部30に命令発行要求を、命令選択部70に命令内容(オペレーション等)を出力する。ここで、命令発行要求は、命令発行を要求するフラグ(以下、要求フラグと呼ぶ)と、当該命令を実行すべき機能ユニットの種類を示す情報(以下機能ユニット番号と呼ぶ)とを含む。命令解読部1~3は、独立に命令流を解読するので、それぞれ上記の論理プロセッサに対応する。本実施形態では1つの物理プロセッサに3つの論理プロセッサを内蔵させるために命令解読部が3つ設けられている。以降、命令解読部1~3と呼んで区別する。同様に論理プロセッサ1~3と呼んで区別する。同様に論理プロセッサ1~3と呼んで区別する。同様に論理プロセッサ1~3と呼んで区別する。

【0020】機能ユニットA20、B21、C22、D23(以下、機能ユニットA、B、C、Dと呼ぶ)は、命令解読部1~3から命令選択部70を介して発行され20た命令(解読結果)を受けて、当該命令実行、すなわちデータアクセス処理や演算処理などを行う。各機能ユニットの機能は、全て同じでよいが理解をし易いようにするためその処理内容を例示する。

【0021】すなわち、機能ユニットAはメモリアクセ ス命令を処理するロードストアユニット、機能ユニット Bは整数演算を処理する整数演算ユニット、機能ユニッ トCは浮動小数点の加減算や整数と浮動小数点間の変換 を行なう浮動小数点ユニット、機能ユニット Dは浮動小 数点の乗除算を行なう浮動小数点ユニットである。さら 30 に本実施形態では機能ユニットBは、整数演算の一処理 内容として、優先度の設定に関する命令を処理する機能 を有している。これらの機能ユニットは、論理プロセッ サ1~3の構成要素ではあるが論理プロセッサと1対1 に対応するわけではなく、論理プロセッサ1~3に共用 される。また、各機能ユニットは、命令を処理中か否か に応じて、命令を受け付けられる状態(以下、単にread yと呼ぶ)にあるか受け付けられない状態(以下、単にn ot readyと呼ぶ)にあるかを命令発行判断部30に通知 する。

【0022】命令発行判断部30は、命令解読部1~3からの命令発行要求(上配要求フラグと機能ユニット番号)を受けて、命令の発行先とすべき機能ユニットを判断し、さらに、各機能ユニットからのreadyか否かを示す通知と、優先顧位制御部60からの各論理プロセッサが停止状態にあるか実行状態にあるかを示す通知とを受けて、機能ユニットA~D毎に、命令を発行可能か否かを判断する。

【0023】命令発行関停部40は、1つの機能ユニッ 当該読み出し命令を実行した論理プロセッサのIDを示トに対して発行可能と判断された命令発行要求が複数あ 50 すフィールドである。例えば、論理プロセッサ3におい

って競合する場合には、優先順位制御部60からの指定 される論理プロセッサ毎の優先度に応じて、複数の命令 発行要求を調停して、発行すべき命令を1つ決定する。 命令発行禁止部50は、命令発行調停部40の調停結果 に対して、当該命令を発行するか否かを最終的に判断 し、判断の結果、発行すべき命令を命令選択部70に指 示する。具体的には、論理プロセッサ毎に緊急を要する 処理が要求された場合には、当該論理プロセッサの命令 流の命令については発行を一時的に禁止し、そうでない 場合には、発行を命令選択部70に指示する。命令発行 禁止部50が一時的に命令発行を禁止しているのは、命 令発行判断部30及び命令発行關停部40による処理の 後に上記の緊急を要する処理が発生した場合に、それを 最優先するためである。命令発行禁止部50は、命令発 行調停部40により発行するべき命令が決定された後に 当該命令の発行を禁止することができるので、緊急を要 する処理の発生タイミングが命令発行調停部40による 決定後であっても、有効に禁止することができる。例え ば、緊急を要する処理の発生タイミングが、マシンサイ クルの期間の遅い時点であっても有効に禁止することが

【0024】優先順位制御部60は、論理プロセッサ毎の優先度の管理、及び論理プロセッサ毎に実行状態にあるか停止状態にあるかを示す情報を管理し、命令発行調停部40に対して上記優先度を通知し、命令発行判断部30に対して上記実行状態か否かを通知する。さらに、優先順位制御部60は、特定の命令実行時に、当該論理プロセッサを所定数の連続サイクルの間優先させる機能(以下、連続サイクル優先機能と呼ぶ)を有している。上記優先度および実行状態か否か示す情報を管理するため、優先順位制御部60は、3本の制御レジスタすなわち優先順位指定レジスタ、内部割込みレジスタ、排他停止レジスタを備える。これらのレジスタは、命令流中の

[0025]命令選択部70は、命令発行禁止部50から発行元の命令解読部及び発行先の機能ユニットを指示する命令発行指示に従って、命令解読部1~3により解読された命令(オペレーション等)を機能ユニットA~Dに発行する。

命令に従ってその値が設定される。

6 〈優先順位制御部60:優先順位指定レジスタ>図3は、優先順位制御部60に内蔵される優先順位指定レジスタ(以下PRIレジスタと呼ぶ)のピット構成を示す説明図である。

【0026】同図のように、PRIレジスタは、MYID、PRI 3、PRIZ、PRI1、MYPRIの各フィールドを有し、論理プロ セッサ毎の優先順位及び停止状態か否かを示す情報を保 持している。MYIDフィールドは、論理プロセッサにおい て本PRIレジスタの読み出し命令が実行されたときに、 当該読み出し命令を実行した論理プロセッサのIDを示 て当該読み出し命令が実行された場合には、論理プロセ ッサ3を示す ID (例えば100) が読み出される。

【0027】PRI3フィールドは、論理プロセッサ3の優 先順位及び停止状態か否かを示すフィールドである。 PR I2、PRI1フィールドは、それぞれ論理プロセッサ2、1 についてPRI3と同様である。MYPRIフィールドは、論理 プロセッサにおいて本PRIレジスタの読み出し命令が実 行されたときに、当該読み出し命令を実行した論理プロ セッサの優先順位を示すフィールドである。例えば、論 理プロセッサ1において当該読み出し命令が実行された 10 [2]は、論理プロセッサが実行状態か停止状態かを示し 場合には、PRI1フィールドの内容がMYPRIフィールドに コピーされて読み出される。

【0028】図4は、PRIレジスタ中のPRI3~PRI1フィ ールドそれぞれの下位2ピットのピット割当てを示す説 明図である。同図ではPRI3~1をPRIxと略し、フィール ド内のピット位置を[ ]内に付記している。ただしx は、論理プロセッサ番号(又はスレッド番号)を示す。 同図のようにPRIx[1:0]は、低(lowest)、中(middle)、 高(highest)の3レベルの優先順位を表す。2ピットで 3レベルの優先順位を表しているのは、PRIx[1]をスー パーパイザモード用、RRIx[0]をユーザモード用として 個別に設定を可能にするためである。この優先順位の設 定は、次に示す専用命令(ニーモニック表記)に従って 機能ユニットBによって行われる。

「inc pri」;との命令は、優先順位を上げる、つまり スーババイザモードではPRIx[1]を1に、ユーザモード ではPRIx[0]を1に設定する。

「dec pri」; この命令は、優先順位を下げる、つまり スーパパイザモードではPRIx[1]をOに、ユーザモード ではPRIx[0]を 0 に設定する。

【0029】これらの命令は、通常のレジスタ間のデー タ転送命令とは異なり、オペランドを必要とせず、オペ レーションコードのみからなる命令なので、どの命令流 においても同じ命令を利用できることになる。例えば、 1つのプログラムから複数の命令流を生成し、各命令流 に異なるデータを分担させて並列に処理する場合に有用

【0030】また、前記一の機能ユニットによって当該 命令が属する命令流の優先度を変更するので、異なる命 令流の優先度を誤って書換えることもなくなり、誤動作 40 を防止することができる。例えば、RGBカラー画像の 色別画像データに同一の画像処理を施す場合、つまり、 画像処理用の1つのプログラムを3つの命令流として独 立かつ同時に実行させる場合、情報の隠蔽(ブログラム はRGBのどれかを区別する必要がない) することがで き、かつ命令流の独立性を保証することができ、その結 果OSやシステム全体の信頼性が向上する。

【0031】とれらの命令及び同図のビット割当てによ れば、例えば、ユーザモードからスーパーパイザモード

へ復帰したときに以前の優先度が保存されることにな る。例えば、ユーザーモードで割り込みが発生し、スー パーバイザーモードに一時的に遷移しても、割り込み処 理からユーザーモードに戻る前に、PRIx[1]を元に戻す ことにより、ユーザーモードでの優先順位が保存される ととになる。

14

【0032】図5は、優先順位を示すフィールドPRIレ ジスタ中のRI3~1フィールドそれぞれの上位 1 ピット のビット割当てを示す説明図である。同図のようにPRIx ている。実行状態から停止状態への設定は、次に示す専 用命令(ニーモニック表記)に従って機能ユニットBに よって行われる。

「halt」; この命令は、発行元の論理プロセッサを停止 状態にする。つまり、当該論理プロセッサのPRIx[2]を 1 に設定する。また、との命令による停止状態を他の命 令による停止状態と区別するときは自己停止状態と呼 *\$*:\_

【0033】自己停止状態の解除(実行状態への復帰) 20 は、命令によるのではなく、当該論理プロセッサに対す る割込み入力による。つまりマルチスレッドプロセッサ では割込み処理は論理プロセッサ個別に発生するので自 己停止状態にある論理プロセッサに対して割込み(外部 割込み、内部割込み等)が発生した時点で解除される。 <優先順位制御部60:内部割込みレジスタ>図6は、 優先順位制御部60に内蔵される内部割込みレジスタ (以下IRレジスタと呼ぶ)のピット構成を示す説明図で ある。ここでいう内部割込みとは、論理プロセッサ間の 割込み、つまり一の論理プロセッサから他の論理プロセ 30 ッサへかける割込みをいう。内部割込みがかけられた論 理プロセッサは、自己停止状態にある場合に自己停止状 態が解除されるので、例えば論理プロセッサ間で同期し て処理する場合や同期通信する場合に用いられる。

【0034】同図に示すようにIRレジスタは、MYIDフィ ールドとIR3~IR1ビットとを有し、他の論理プロセッサ に対して内部割込みを要求するためのレジスタである。 MYIDフィールドは、既に説明した図5と同様であるので 省略する。IR3ビットは、論理プロセッサ3に対して他 の論理プロセッサが内部割込みを要求するピットであ る。このビットがONになると、その割込み要求を受け た命令解読部3の制御によってPR3[2]が0に設定される とともにIR3もOFFに戻される。ここでPR3[2]がOに 設定されることにより論理プロセッサ3の自己停止状態 が解除される。

【0035】IR2、IR1ビットも、それぞれ論理プロセッ サ2、1に対する割り込み要求ビットであり、IR3ビッ トと同様である。IR3~IR1ビットの設定は、通常のレジ スタ転送命令に従って行われる。通常のレジスタ転送命 令命ではIR3~IR1のビット位置に直接書き込む必要があ に移行して優先順位を変更した場合でも、ユーザモード 50 るので、各命令流は自身の論理プロセッサ I D と割込み 10

先の論理プロセッサ I Dとを区別する必要があるが、上 記のMYIDフィールドを読み出すことによって各命令流に おいて論理プロセッサIDの操作を可能にしている。 <優先順位制御部60:排他停止レジスタ>図7は、優 先順位制御部60に内蔵される排他停止レジスタ (以下 EXCLレジスタと略す〉のビット構成を示す説明図であ る。 ことで、排他的停止とはある 1 つのプロセッサ以外 の論理プロセッサを停止させることをいう。ただし、2 つ以上の論理プロセッサが同時に排他的停止状態にはな るととはできない。

【0036】同図に示すようにEXCLレジスタは、MYIDフ ィールドとEXCL3~EXCL1の各ピットとを有し、1つの論 理プロセッサのみを実行状態にし、他の論理プロセッサ を停止状態にすることを要求するためのレジスタであ る。MYIDフィールドは、図3及び図6と同様なので説明 を省略する。EXCL3ピットは、このピットがONのとき 論理プロセッサ3が排他的停止を実行していることを示 す。この場合実行できるのは論理プロセッサ3のみで、 論理プロセッサ2および論理プロセッサ1は停止状態に なる。

【0037】EXCL2、EXCL1の各ピットも、同様である。 これらのEXCL3~EXCL1の各ピットは、次に示す専用命令 (ニーモニック表記) に従って機能ユニットBによって 設定及び解除がなされる。

「excsv」:との命令は、発行元の論理プロセッサに対 する排他停止の設定つまり発行元以外の全論理プロセッ サを停止させる命令である。例えば、論理プロセッサ1 がこの命令を実行した場合、EXCL1がONに、EXCL2及び EXCL3がOFFに設定される。また、仮に複数の論理ブ ロセッサが同時にこの命令を発行したとしても、全論理 30 プロセッサが動作を停止することはない。なぜなら、こ の命令は機能ユニットBにのみ実行されるので、実行時 点では1つに限定されるからである。

「retex」:この命令は、発行元の論理プロセッサに対 する排他停止の解除、つまり他の全論理プロセッサを元 の状態に復帰させる命令である。例えば、論理プロセッ サ1がこの命令を実行した場合、EXCL1がOFFに設定 される。

【0038】これらの命令も、上記incpr命令、decpr命 令と同様、オペランドを必要としない、どの命令流にお 40 いても同じ命令を利用できる。上記のPRIレジスタ、IR レジスタ、EXCLレジスタの3つの制御レジスタは、物理 的な実体はそれぞれ1つずつであるが、各レジスタのMY IDフィールドとPRIレジスタのMYPRIフィールドは、自論 理プロセッサ自身の値を表示するため、各論理プロセッ サからは論理プロセッサビとに異なるレジスタが存在す るかように見える。また、これらの制御レジスタのアド レシングはすべての論理プロセッサから同じため、同じ 命令を実行してもそれぞれ自論理プロセッサ自身のID や優先順位を見ることができる。

<命令発行判断部30>図8は、図1の命令発行判断部 30のより詳細な構成例を示すブロック図である。との 命令発行判断部30は、停止判断部310、分配部32 0、発行判断部330を備える。

16

【0039】停止判断部310は、命令解読部1~3の それぞれに対応する3組のNOR回路とAND回路を備 える。NOR回路とAND回路との各組は、命令解読部 から上述した命令発行要求(要求フラグと機能ユニット 番号)を受けて、各論理プロセッサ毎に自己停止状態 (PRIレジスタのPRIx[2]がON) 又は排他停止により停 止状態になっている (EXCLxビットがON) 場合には、 要求フラグの信号(以下要求有無信号と呼ぶ)を強制的 にOFFにし、実行状態でかつ排他停止により停止され ていない場合には、要求有無信号をそのまま出力する。 【0040】分配部320は、命令解読部1~3のそれ ぞれに対応する3つのデマルチプレクサを備える。各デ マルチプレクサは、停止判断部310を介して入力され る要求有無信号を、機能ユニット番号に従って当該命令 を実行すべき機能ユニットに分配する。その結果、機能 20 ユニット毎に各命令解読部からの要求有無信号が出力さ れる。

【0041】発行判断部330は、機能ユニットA~D のそれぞれに対応する4組のAND回路群を備える。各 AND回路群は、分配部320により分配された要求有 無信号を、機能ユニットが上述したread/状態である場 合には、そのまま出力し、notready状態である場合には OFFにして出力する。ととで、ready状態で有るとと を示すready\_n信号(nはA、B、C又はD)は、対応す る機能ユニットが命令を受け付けられる状態にあること を示し、論理プロセッサ1~3に対応して機能ユニット xから出力される3ビットの信号である。発行判断部3 30からの出力信号(1A~3A、1B~3B、1C~3C、1D~3 D) については、いずれも論理"1"のとき有効(命令 発行可能)であり、例えば、出力信号1Aは発行元が命令 解読部1で発行先が機能ユニットAを、出力信号3Bは発 行元が命令解読部3で発行先が機能ユニットBを意味す

<命令発行調停部40>図9は、図1の命令発行調停部 40のより詳細な構成例を示すブロック図である。この 命令発行調停部40は、機能ユニットA~Dのそれぞれ 対応する調停部40A~40Dを備える。各調停部は同 じ動作をするので、ことでは調停部40Aを代表として 説明する。調停部40Aは、優先順位判定部41Aと判 定補助部42Aとを備える。

【0042】優先順位判定部41Aは、発行判断部33 Oからの出力される信号1A、2A、3Aと、各論理プロセッ サの優先順位PRI1[1:0]、PRI2[1:0]、PRI3[1:0]を受け て、有効な要求有無信号のうち優先順位が最も高いもの を出力する。優先順位判定部41Aにおいて、この機能 50 を実現するための制御論理を図10に示す。図10

(a)では、PRIレジスタ中のPRI1、PRI2、PRI3フィー ルドに指定された論理プロセッサ1~3の優先順位がPR LI>PRI2>PRI3の場合、つまり優先レベルでは(PRI1、 PRI2、PRI3) = (高、中、低) の場合の入力1A、2A、3A と、出力1A´、2A´、3A´とを示している。また、図示 していないが、優先顧位がPRI>PR3>PR2の場合、PR2> PR1>PR3の場合、PR2>PR3>PR1の場合、PR3>PR1>PR2 の場合、PR3>PR2>PR1の場合にも、いずれもの信号名 を読み換えるだけで全く同じ制御論理になるので、説明 を省略する。

【0043】図10(b)では、優先順位がPRI1=PRI2 >PRI3の場合、つまり優先レベルでは(PRI1、PRI2、PR 13〉= (高、高、中)、(高、高、低)又は(中、中、 低)の場合を示している。図示していないが、優先順位 がPR1= PR3> PR2の場合、PR2= PR1> PR3の場合、PR2= P R3>PR1の場合、PR3=PR1>PR2の場合、PR3=PR2>PR1 の場合にも、いずれも信号名を読み換えるるだけで全く 同じ制御論理になるので、説明を省略する。また、図中 の波線を付した出力信号のように、入力信号のうち優先 順位が最も高く、かつ有効な信号が2つ以上存在する場 20 するように構成されている。 合には、優先順位判定部41Aはそれらを一応"1"と して出力する。

【0044】図10(c)では、優先順位がPRI1>PRI2 = PRI3の場合、つまり (PRI1、PRI2、PRI3) = (高、 中、中)、(高、低、低)又は(中、低、低)の場合を 示している。また、図示していないが、優先順位がPRI >PR3=PR2の場合、PR2>PR1=PR3の場合、PR2>PR3=P R1の場合、R3>R1=R2の場合、R3>R2=R1の場合 にも、いずれもの信号名を読み換えるだけで全く同じ制 御論理になるので、説明を省略する。

【0045】また、優先順位判定部41Aは、優先順位 がPRI1= PRI2= PRI3の場合には、有効な入力信号が2つ 以上ある場合には、有効な信号を全て一応"1"として 出力する。判定補助部42Aは、PRIレジスタにおいて 優先順位が同じに設定されている論理プロセッサが同時 に命令発行要求を出した場合、つまり、優先願位判定部 4 1 Aの出力(1A´、2A´、3A´)において"1"が2 つ以上ある場合、論理プロセッサ間で命令発行が偏らな いように調整するため、何れを"1"するか判定する。 例えば、判定補助部42Aは、(1)サイクル(1サイ 40 クル又は数サイクル)毎に"1"とする論理プロセッサ を変更する(2)以前命令発行をできなかった論理プロ セッサを優先する(3)固定的に何れかを決めておく。 また、これらを切り替えるようにしてもよい。

<命令発行禁止部50>図11は、図1の命令発行禁止 部50のより詳細な構成例を示すブロック図である。と の命令発行禁止部50は、機能ユニットA~Dのそれぞ れ対応する禁止部50A~50Dと、発行通知部55と を備える。各禁止部は同じ動作をするので、ことでは禁 止部50Aを代表として説明する。

【0048】禁止部50Aは、緊急を要する処理とし て、外部割込み要求、内部割り込み要求、キャッシュミ スやメモリアクセスエラー等のアクセス例外、トラップ 命令などが発生した場合に、その発生元の論理プロセッ サIDを検出し、当該論理プロセッサに対する命令発行 を1サイクルの間の禁止するよう制御する禁止制御部5 1Aと、禁止制御部51Aの指示に従って調停部40A の出力信号(1AA~3AA)をゲートした結果を命令選択部 70に対する命令発行指示 (1AAA~3AAA) を出力する3 10 個のAND回路と、機能ユニットAに対して命令発行を 通知するOR回路とからなる。

【0047】発行通知部55は、命令解読部1~3に対 応する3個のOR回路からなり、禁止部51A~51D から各論理プロセッサの命令発行指示が出力される毎 に、対応する命令解読部に次の命令を発行してもよいこ とを通知する発行通知を出力する。

<機能ユニットB>機能ユニットBは、整数演算命令を 実行するほか、上述した各種の専用命令と、PRIレジス タ、EXCLレジスタ、IRレジスタを読み出す命令とを実行

【0048】なお、上記専用命令等については、本実施 形態では機能ユニットBが実行するが、他の機能ユニッ トが実行するように構成してもかまわない。図12に、 機能ユニットBによる上記専用命令及び読み出し命令の 実行内容を示す説明図を示す。同図において、「x」は 当該命令の発行元の論理プロセッサ番号を、「v」は当 該命令の発行元以外の論理プロセッサIDを示す。との 論理プロセッサ番号は、禁止部50Bから出力される信 号(図11の1BBB~3BBB) により機能ユニットBに通知 30 される。

【0049】同図に示すように機能ユニットBは、「in c pri」命令に対して、スーパパイザモードではPRIレジ スタのPRIx[1]ピットを1に、ユーザモードではPRIx[0] ピットを1を設定する。「dec pri」命令に対しては、 スーパパイザモードではPRIx[1]をOに、ユーザモード ではPRIx[0]ピットをOに設定する。

【0050】「halt」命令に対しては、当該論理プロセ ッサのPRIレジスタのPRIx[2]ピットに l を設定する。 「excsv」命令に対しては、EXCLレジスタのEXCLxビット を1に、EXCLyビットを0に設定する。例えば、論理ブ リセッサ2が本命令の発行元である場合、機能ユニット Bは、EXCL2ピットを1に、EXCL3ピットおよびEXCL1ピ ットを0に設定する。

【0051】「retex」命令に対しては、EXCLxビットを 0に設定する。 このように上記の専用命令は、同じ命令 であっても当該命令発行元の論理プロセッサに応じてレ ジスタ中の異なるピットが操作される。また、図12に 示した各mov命令については、機能ユニットBは以下の ように実行する。

【0052】「mov PRI,RO」命令は、PRIレジスタの内

容をROレジスタに転送する命令である。この命令に対し て機能ユニットBは、以下のように命令を実行する。PR Iレジスタ中のMYIDフィールド (=PRI[31:29]) について は、その命令の発行元の論理プロセッサ | DをR0[31:2 9]の各ピットに書き込む。PRIレジスタ中のPRI[11:3](= PRI3, PRI2, PRI1フィールド)の各ピットについては、そ のデータを読み出してROレジスタ中の[11:3]に転送す

19

【0053】PRI[2:0] (=MYPRIフィールド) について は、PRI3,PRI2,PRI1フィールドのうちその命令の発行元 10 命令内容を示すコメントである。 の論理プロセッサ I Dに対応する PRIxをR0[31:29]の各 ビットに書き込む。「mov IR,RO」命令は、IRレジスタ の内容をROレジスタに転送する命令である。この命令に 対して機能ユニットBは、IRレジスタ中のMYIDフィール ド(=IR[31:29]) については、その命令の発行元の論理 ブロセッサ I DをR0[31:29]の各ピットに書き込む。IR [2:0] (=IR3,IR2,IR1ビット) の各ピットについては、 その値を読み出してRO[2:0]の各ピットに書き込む。 【0054】「mov EXCL,RO」命令は、EXCLレジスタの 内容をROレジスタに転送する命令である。この命令につ 20 いての機能ユニットBの実行内容は、上記「mov IR,R 0」に比べて、転送元がIRレジスタであること以外同 様である。上記の読み出し命令を実行することにより、

<優先順位制御部60の詳細構成>図13は、優先順位 制御部60の詳細な構成を示すブロック図である。

各論理プロセッサは、読み出されたMYIDフィールド

から自身の論理プロセッサIDの値と、他の論理プロセ

ッサの状態(優先順位、自己停止状態、排他停止状態な

ど)とを得ることができる。

【0055】優先順位制御部60は、PRIレジスタ6 1、IRレジスタ62、EXCLレジスタ63、セレクタ6 4、連続サイクル優先部69を備える。PRIレジスタ6 1、IRレジスタ62、EXCLレジスタ63は、図3、図 6、図7においてそのビット構成を既に説明したので、 ここでは、そのハードウェア構成を説明する。

【0056】とれらのレジスタ61~63は、本マルチ スレッドプロセッサの内部バスに接続され、内部バスを 介して機能ユニットBに読み出し書き込みがなされる。 これらのレジスタの上位3ピット (MYIDフィールド) は、データを保持する機能を有せず、レジスタの読み出 40 し命令実行時に、論理プロセッサIDをトランスパレン トに内部バスに出力する。このとき論理プロセッサID の館は、禁止部50Bから出力される信号(図11の1B BB~3BBB) により通知される。

【0057】またPRIレジスタ62の下位3ピットは、P RIレジスタの読み出し命令実行時に、セレクタ64の出 力をトランスパレントに内部パスに出力する。セレクタ 64は、PRIレジスタの読み出し命令実行時に、PRIレジ スタ62中のPRI3、PRI2、PRI1フィールドのうち、その命 て、IRレジスタ62中の「MYPRI」フィールドを介し て内部バスに出力する。

【0058】連続サイクル優先部69は、特定の命令列 が実行される間、その優先度を一時的に高く変更する機 能を有する。ここで、特定の命令列とは、例えば他の論 理プロセッサと共有する資源の読み出しと書き込みを実 行する場合など、連続サイクルで実行される必要がある 命令列をいう。特定の命令列の一例を以下に示す。ただ し命令はニーモニック表配で表している。また:以下は

LOOP:

:ラベル

aldst MEM[100],R0

;アトミック (Atomic Load STart) 命令とも呼ぶ。 【0059】;メモリ(100番地)のデータをROに 転送する

test RO

:R0=0ならばゼロフラグを1にセットする

;ゼロフラグが1ならラベルLOOPへ分岐する store R1.MEM[100]

;レジスタR1のデータをメモリ100番地に転送する 上記の特定命令列は、メモリの100番地を読み出し、 もし読み出したデータが0であれば、レジスタR1のデ ータをメモリの100番地に書き込む。もし読み出した データが0でなければ、0になるまで繰り返し読み出す ルーブ処理を表している。との特定命令列が連続サイク ルで実行される必要があるのは、例えばメモリ100番 地が複数の論理プロセッサの共有資源として用いられて 30 いる場合である。つまり、ある論理プロセッサが上記特 定命令列の実行中には、他の論理プロセッサがメモリ1 00番地を書き換えてはならない。

【0060】とのような特定命令列が連続するサイクル で実行されることを保証するために、連続サイクル優先 部69は、一の機能ユニットで上記特定命令列の先頭命 令の実行開始を検出したとき、その命令の実行サイクル から連続する所定数のサイクルの間、その命令発行元の 論理プロセッサ (命令流) の優先順位が他の論理プロセ ッサよりも高くなるように優先順位制御部60の優先順 位を一時的に変更する。

<連続サイクル優先部69>連続サイクル優先部69 は、図13のように特定命令検出部65、カウンタ6 6、コンパレータ67、セレクタ68を備える。

【0061】同図において特定命令検出部65は、特定 命令列の先頭命令(以下特定命令と呼ぶ)の実行が開始 されたことを検出する。上記の特定命令列の例では、al dst命令が特定命令として検出される。より具体的には 特定命令検出部65は、命令解読部1~3から特定命令 を解読した旨の通知と、特定命令を命令発行禁止部50 令発行元の論理プロセッサIDに対応するものを選択し 50 がその一の機能ユニットに発行した旨の通知とを受け

て、両通知をともに受けたことをもって特定命令の実行 開始を検出する。

【0062】カウンタ66は、特定命令の実行開始が検出されたとき、特定命令列の実行に要するサイクル数をカウントする。上記の例ではカウンタ66は、aldst命令に続く3命令の実行に要する3サイクルをカウントするため、特定命令の実行開始が検出されたときに初期値3がロードされ、0までダウンカウントする。これにより上記store R1,MEM[100]の実行サイクルで0になる。また、上記特定命令列がループ処理になっている場合に10は、カウンタ66はaldst命令が検出される度に初期値3からカウントすることになる。

【0063】コンパレータ67は、カウンタ66のカウント値が0と一致するか否かを判定する。つまり特定命令列の連続サイクルの期間でないかどうかを判定する。セレクタ68は、6ビット長の4入力1出力のセレクタであり、連続サイクルの期間において優先順位を一時的に変更するために用いられている。図14に、セレクタ68に入力される選択信号と、出力値との関係を表した説明図を示す。セレクタ68の入力値は、同図では省略20されているが、図13に示したように「PRI[11:3](=PRI 3[1:0], PRI2[1:0], PRI1[1:0]」、「110000」、「001100」、「000011」の4つである。

【0064】 同図によれば、セレクタ68の出力は、通常のとき、つまり連続サイクルの期間でない場合(カウント値=0に一致するとき)、PRIレジスタ中のPRI[11:3](=PRI3,2,1フィールド)に指定されている優先順位を出力する。連続サイクルの期間である場合(カウント値=0に一致しないとき)、セレクタ68は、その特定命令の発行元が論理プロセッサ3であれば「110000」、論 30理プロセッサ2であれば「001100」、論理プロセッサ1であれば「00001」を、「PRI[11:3](=RRI3'[1:0],PRI 2'[1:0],PRI1'[1:0]」として出力する。

【0065】 これにより連続サイクルの期間中、特定命令の発行元の論理プロセッサの優先順位が最も高くなるように一時的に変更される。以上のように構成された本実施形態のマルチスレッドプロセッサについて、その動作を説明する。

<優先順位、自己停止状態、排他停止の設定動作>本実施形態のマルチスレッドプロセッサでは、命令流(論理 40 プロセッサ)毎の優先順位の設定・変更用にincpr命令及びdecpr命令、自己停止用にhalt命令、排他停止用にexcsv命令及びretex命令という専用命令が用意されている。これらの専用命令は、命令流の生成元のプログラム中に予め適宜設定されている必要がある。

【0066】たとえば、プログラム中の優先順位を上げ ッサを決定する。例えば、機能ユニア処理すべき部分では、当該プログラム部分の直前にin 解読部 1 からの命令発行要求のみが cpr命令を、直後にdecpr命令を設定しておけばよい。 C (図9の18~38のうち18のみ有効な で調停部 4 0 は、その命令発行要求 ニット B によって次のように実行される。すなわち、機 50 ~388のうち188のみ有効)とする。

能ユニットBは、論理プロセッサ1~3の何れが発行元であるかに応じて、PRIレジスタの対応するPRxフィールドに対してユーザモードのときはPRIx[0]ピットを対象に、スーパーバイザモードのときはPRIx[1]を対象にして1又は0を設定する。これにより論理プロセッサ毎に優先順位を必要に応じて助的に変更させることができ

【0067】また、他の論理プロセッサを停止させて自 身の論理プロセッサのみを動作させて処理すべきプログ ラム部分では、当該プログラム部分の直前にexcsv命令 を、直後にretex命令を設定しておくことになる。これ らの命令も、機能ユニットBによって上記と同様に実行 される。逆に、他の論理プロセッサを優先させて自身の 論理プロセッサを停止させる場合には、halt命令を設定 することになる。この命令も機能スニットBによって実 行される。但し、停止状態の論理プロセッサは、当該論 理プロセッサに対する割り込み要求によって停止状態が 解除されるので、割り込み要求が適宜入力される必要が ある。例えば論理プロセッサ間の内部割込みは、IRレジ スタによる。つまり、割込みをかける論理プロセッサ は、事前に通常のレジスタ転送命令によりIRレジスタ、 PRIレジスタまたはEXCLレジスタを読み出して自身のMYI Dを読み出して、さらに割込み先の論理プロセッサに対 応するIRxビットを決定してから、通常の転送命令によ りIRレジスタに内部割り込み要求をセットすることにな

<全体動作>例えば、命令解読部1の解読の結果、機能ユニットBに対する命令発行要求(要求フラグと機能ユニットBの番号)を出力した場合、論理プロセッサ1が自己停止状態または他の論理プロセッサの排他停止による停止状態にある場合には、命令発行判断部30内の停止判断部310によって要求フラグ自体が無効として出力されなくなる。これにより他の論理プロセッサ2及び3が機能ユニットを使用できることになる。

[0088] 論理プロセッサ1が自己停止状態でもなく他の論理プロセッサの排他停止による停止状態でもない場合には、命令発行判断部30内の分配部320において機能ユニットBへ分配され、さらに、機能ユニットBが論理プロセッサ1に対してready状態であれば発行判断部330によって発行可能と判断され、not ready状態であれば発行不可と判断される。

【0069】次に、命令発行調停部40は、命令発行判断部30からの機能ユニットでとの命令発行要求を受けて、優先順位制御部80からの論理プロセッサでとの優先順位を用いて、機能ユニットに発行できる論理プロセッサを決定する。例えば、機能ユニットBに対して命令解読部1からの命令発行要求のみが出力されている場合(図9の18~38のうち18のみ有効な場合)には、命令発行調停部40は、その命令発行要求を有効(図9の188~388のみち188のみ有効)トする

【0070】例えば、命令解読部1が機能ユニットAに 対する命令を解説し、命令解説部2は機能ユニットBに 対する命令を解読し、命令解読部3が機能ユニットCに 対する命令を解読し、かつ、すべての機能ユニットが命 令をready状態にある場合には、命令発行調停部40に おいて3個の命令発行要求がすべて有効になる。一方、 命令解読部1が機能ユニットAに対する命令を解読し、 命令解読部2も機能ユニットAに対する命令を解読した 場合(図9の1Aと2Aとが同時に有効な場合)には、どち らかの命令しか発行できないので、優先順位判定部41 10 タとして構成してもよい。 Aは、優先順位制御部60内にPRIレジスタより優先 順位を判断し、優先順位の高いものから命令を発行す る。もし、この場合に論理プロセッサ1と論理プロセッ サ2の優先順位が同じであれば、判定補助部42Aによ り何れかの命令発行要求のみを有効にする。

【0071】さらに、命令発行禁止部50は、命令発行 調停部40で発行されるととが決定した命令に対し、論 理プロセッサの何れかで緊急を要する処理が発生した場 合に当該論理プロセッサの命令発行を禁止する。命令発 行判断部30と命令発行禁止部50とは、何れも命令発 20 行要求を命令発行の候補から外す機能を有しているが、 機能分担しているのは次の理由による。

【0072】すなわち、早い段階で命令の受け入れがで きないことがわかる要因については、命令発行判断部3 0において、受け入れができない論理プロセッサの命令 を発行不可と判断し命令発行の候補から外すことができ るが、もし、遅い段階でしかわからない要因についてま で、命令発行判断部30において、命令発行の候補から 外そうとすると、命令発行可能か否かの最終判断が遅れ てしまい、ブロセッサの周波数向上に影響するからであ 30 と同じ番号の構成要素は、同じなので説明を省略して、 る。

【0073】例えば、命令発行判断から命令発行禁止ま でを1サイクルで行なうとした場合に、サイクルの最後 の方で命令発行不可要因が命令発行判断部30に通知さ れると、その時点から命令発行の候補から外す必要があ る。との場合にはサイクル長を十分長く取る必要があ り、クロック周波数の向上を阻害する大きな要因とな る。そとで、遅い段階でしかわからない命令発行禁止の 要因については、命令発行禁止部50において、発行を 禁止する。もちろん、命令発行禁止部50である論理プ 40 ロセッサの命令発行が禁止された場合は、それ以外の論 理プロセッサからの命令を発行できるとしても、その命 令を代わりに発行することはしない。既にそれぞれの機 能ユニットA~Dに対して、発行すべき命令が1つに紋 り込まれた後だからである。

【0074】との後、命令選択部70は、命令解読部1 ~3 に解読された命令内容やオペレーションを、命令発 行禁止部50からの命令発行指示(図11の1AAA~3AA A 1BBB~3BBB、1CCC~3CCC、1DDD~3DDD) に従って機

理プロセッサが3つ、機能ユニットが4つの場合を説明 したが、これらの数は任意に変更すること当然可能であ る。

24

【0075】また、PRIレジスタの内容を複数のレジ スタで分担する用にしてもよい。例えば、自己停止用の 各PRIx[2]ピットと、優先順位用の各PRIx[1:0]フィール ドとは別個のレジスタとしてもよい。逆に、PRIレジ スタとIRレジスタとEXCLレジスタとは、これらの 全部の組み合わせ又は一部の組み合わせを1本のレジス

【0076】また、特定命令検出部65は、特定命令の 実行開始を検出を、その命令の実行を開始した機能ユニ ットからその旨の通知を受けることにより行ってもよ い。本実施形態では複数の論理プロセッサが機能ユニッ トに対して命令発行が競合する場面に本発明を適用する 例を示したが、機能ユニット以外であっても、複数の論 理プロセッサが共有する資源であれば適用することがで きる。これを他の実施形態として説明する。

<他の実施形態>本実施形態では、複数の論理プロセッ サが共有する資源にアクセスする場合の調停にも論理プ ロセッサ間の優先順位を用いることが可能であり、その 一例を示す。

【0077】図2は、本発明の他の実施形態におけるマ ルチスレッドプロセッサの構成を示すプロック図であ る。本マルチスレッドプロセッサは、キャッシュメモリ 100、命令解読部111~113、レジスタ群131 ~133、命令フェッチ制御部140、命令発行制御部 150、優先順位制御部60、機能ユニットA20~D 23、レジスタ制御部170を備えて構成される。図1 異なる点を中心に説明する。

【0078】図2において、キャッシュメモリ100 は、命令流が生成される元のプログラム用のキャッシュ メモリである。命令解読部111~113は、それぞれ 図1の命令解読部1~3と同等であるが、命令フェッチ 制御部140の制御を受ける点が異なっている。 レジス タ群131~133は、それぞれ複数レジスタからなる レジスタファイルであり、命令解読部111~113に 1対1に対応して設けられている。従って論理プロセッ サ1~3にも1対1に対応している。

【0079】命令フェッチ制御部140は、図1に示し た命令発行關停部40及び命令発行禁止部50に対し て、命令発行要求ではなく命令フェッチ要求の競合を調 停及び禁止する点が異なる点を除いて同様の機能を有す る。すなわち、優先順位制御部60からの論理プロセッ サビとの優先順位の指定などを入力とし、キャッシュメ モリ100に対して複数の命令解読部が同時に命令フェ ッチ要求が出された場合に、優先順位に応じてフェッチ する順序を決定したり、また、特定の論理プロセッサの 能ユニットA~Dに発行する。なお、本実施形態では論 50 実行を停止する場合には、その論理プロセッサの命令解 **読部からの命令フェッチを停止する。** 

【0080】命令発行制御部150は、図1に示した命 令発行判断部30、命令発行調停部40、命令発行禁止 部50および命令選択部70を1つの構成要素として記 しており、それらを併せた機能と同等であるので説明を 省略する。レジスタ制御部170は、図1に示した命令 発行判断部30および命令発行調停部40に対して、命 令発行要求ではなくレジスタアクセス要求の競合を停止 及び調停する点が異なる点を除いて同様の機能を有す る。すなわち、優先順位制御部60からの論理プロセッ 10 サビとの優先順位の指定などを入力とし、同一のレジス タ群に対して同時に複数の機能ユニットがデータを書き 込む要求を出力した場合に、優先順位に応じて書き込む 順序を決定する命令発行制御部である。

25

【0081】上記の構成により機能ユニットに対する論 理プロセッサの競合だけでなく、キャッシュメモリへの 命令フェッチ要求の競合、レジスタ群へのデータアクセ ス要求の競合の場面でも、優先順位に応じた調停や停止 を実施することができる。なお、上記の実施形態では、 複数の命令流および論理プロセッサの数を3、機能ユニ 20 ットの数を4としたが、この数はいくらでもかまわな

【0082】また、優先順位のレベルは2ピット3レベ ルとしたが、実際には幾つでもよい。さらに、制御レジ スタを32ビット幅にしたが、他のビット幅でもかまわ ない。また、複数の論理プロセッサで同時に分岐が発生 した場合に、アドレス計算のための資源やキャッシュな ど共有しているものについても、他の実施形態と同様に 優先順位によって調停することができる。

タには専ら専用命令により優先順位を変更するように構 成されているが、専用命令以外にハードウェアにより設 定・変更するように構成してもよい。この場合、各命令 流の優先順位を予め定められたタイミングにより、又は 命令流の状態を監視してその状態により、ハードウェア の外部的要因や内部的要因をトリガーにして優先順位を 変更するようにしてもよい。

【0084】また、上記実施形態では図9の優先順位判 定部41Aにおいて、2つ又は3つの優先順位が同じ場 合に、一応それらを全部有効にして出力するようにして 40 いるが、何れか1つを有効にして出力するようにしても よい。その場合、判定補助部42Aを削除することがで きる。また、図9の判定補助部42Aは優先順位判定部 41Aの後段に設けられているが、優先順位制御部60 と優先順位判定部41Aの間に設けて、同じ優先順位が 複数ある場合には、優先順位を動的に変更するように構 成してもよい。

【0085】さらに、上配実施形態においてPRIレジ スタ中のMYPRIフィールドは、PRIレジスタの読

と同様にして例えばMYDATAフィールドを設けて、 論理プロセッサ毎に状態を示すデータ (ステータスデー タ、エラー情報など)を出力するようにしてもよい。禁 止部50Aが検出している緊急を要する処理は、各種イ ベントや各種例外処理であってもよい。ことで各種イベ ントとは外部割込みや内部割込みなどである。各種例外 処理とはキャッシュミスやメモリアクセスエラーなどの アクセス例外、トラップ命令、演算例外、演算実行エラ ーなどである。

26

【0086】また、上記実施形態では、各命令解読部は 命令流1個につき1命令を解読し、一度に発行できる命 令も1個であるものとしていた。これに限らず、命令解 読部が命令流1個につき複数の命令を解読し、同時に複 数の命令を発行する場合であってもよい。

[0087]

【発明の効果】本発明のマルチスレッドブロセッサは、 それぞれ命令を実行する複数の機能ユニットと、命令流 に対応して設けられ、それぞれ命令を解読して、当該命 令を実行すべき機能ユニットを指定するとともに当該機 能ユニットに解読された命令を発行すべきことを要求す る命令発行要求を作成する複数の命令解読手段と、命令 流毎に命令流の優先度を保持する保持手段と、2以上の 命令発行要求が同時に一の機能ユニットを指定している 場合に、保持手段に保持された優先度に従って、当該機 能ユニットに発行すべき解読された命令を決定する制御 手段とを備えて構成される。

【0088】この構成によれば、各機能ユニットに発行 すべき命令(命令の解読結果)が前配優先度に従って決 定されるので、複数の命令流間で負荷のばらつきを優先 【0083】さらに、上記実施形態では、PRIレジス 30 度に応じて柔軟に調整することができ、命令流毎に必要 とされる処理性能を適切に実現し、かつ全体の処理効率 を向上させることができるという効果がある。ここで前 記保持手段は、さらに、命令によって設定可能な、命令 流毎に命令流を停止すべきか実行すべきかを示すフラグ 群を保持し、前記制御手段は、前記決定を行う調停手段 と、停止を示すフラグが設定されている場合には、その フラグに対応する命令流の命令発行要求を除外して前記 決定を行うことにより、当該命令流を停止する停止手段 とを備えてもよい。

> 【0089】この構成によれば、さらに、命令流がその 実行過程においてアイドル状態や待ち状態にある場合に は、その命令流を停止状態とすることができる。つまり その結果、他の命令流を優先して実行させることができ るので、さらに全体の処理性能を向上させることができ る。ととで前配制御手段は、さらに何れかの命令流に対 して緊急を要する処理が発生した場合に、当該命令流に 属する命令であって前配制御手段において発行すべきで あると決定された命令について、機能ユニットへの命令 発行を一時的に禁止する禁止手段を備えてもよい。

み出し命令を発行元の優先順位を出力しているが、これ 50 【0090】この構成によれば、ある命令流(論理ブロ

セッサ)に対して緊急を要する処理が発生した場合に、 禁止手段により当該論理プロセッサの命令発行が一時的 に禁止する。つまり緊急を要する処理に移行するまで要 するサイクル数だけ一時的に命令発行を禁止する。これ により、割込み処理への移行を高速化することができ る。知しかも、禁止手段は、調停手段により発行するべ き命令が決定された後に当該命令の発行を禁止すること ができるので、緊急を要する処理の発生タイミングが調 停手段による決定後であっても、有効に禁止することが できる。例えば、緊急を要する処理の発生タイミング が、マシンサイクルの期間の遅い時点であっても有効に 禁止することができるという効果がある。

27

【0091】とこで機能ユニットの1つは、優先度の変 更を指示する専用命令を受け、保持手段に保持された優 先度のうち、当該専用命令が属する命令流の優先度を変 更するように構成してもよい。ことで前記専用命令は、 優先度を上げる又は下げることを指示するオペレーショ ンコードのみからなり、前記機能ユニットの1つは、専 用命令の解読結果が発行された場合、当該専用命令を発 段に対応する命令流の優先度を上げ又は下げるように構 成してもよい。

【0092】この構成によれば、さらに、上記専用命令 では、命令流のIDや命令流を特定するためのビット位 置を示すオペランドを必要としないので、どの命令流に おいても同一の命令により自身の命令流の優先度を簡単 に変更することができる。また、前記一の機能ユニット によって当該命令が属する命令流の優先度を変更するの で、異なる命令流の優先度を誤って書換えることもなく なり、誤動作を防止することができる。例えば、RGB 30 カラー画像の色別画像データに同一の画像処理を施す場 合、つまり、画像処理用の1つのプログラムを3つの命 令流として独立かつ同時に実行させる場合、情報の隠蔽 (プログラムはRGBのどれかを区別する必要がない) することができ、かつ命令流の独立性を保証することが でき、その結果OSやシステム全体の信頼性が向上す

【0093】ととで前記保持手段は、読み出し専用の第 1フィールドを有する制御レジスタを含み、前配機能ユ ニットの1つは、制御レジスタの読み出し命令の解読結 40 果が発行された場合、当該読み出し命令を発行した命令 解読手段を判別して、当該命令解読手段に対応する命令 流のIDを第1フィールドの読み出しデータとして内部 バス上に出力するように構成してもよい。

【0094】との構成によれば、さらに、上記のように 1つのプログラムを3つの命令流として独立かつ同時に 実行させる場合に、実際は1つのプログラムではあるが 3つの仮想的なプログラムが並列実行されていることに なる。それぞれの仮想的なプログラム(または命令流) は、それぞれ第1フィールドを読み出すことにより命令 50 プロセッサは、複数の命令流を同時かつ独立に並列実行

流自身のIDを容易に知ることができる。

【0095】ととで前記保持手段は、制御レジスタを有 し、前記制御レジスタは、さらに、命令流固有のデータ を保持するための命令流毎の個別フィールドと、読み出 し専用の第2フィールドとを有し、前記機能ユニットの 1つは、前配制御レジスタの読み出し命令の実行に際し て、さらに、命令流毎の個別フィールドを読みだすとと もに、当該読み出し命令を発行した命令解読手段に対応 する命令流の固有のデータを第2フィールドの読み出し 10 データとして内部パス上に出力するように構成してもよ

【0096】この構成によれば、上記の仮想的なプログ ラム(または命令流)は、第2フィールドを読み出すこ とにより自身の優先度を容易に知ることができる。こと で前配保持手段は、命令流毎の優先度を保持する優先度 フィールドを有し、前記優先度フィールドは、命令流の 実行モード別の優先度を示す小フィールドからなり、前 記機能ユニットの1つは、専用命令の解読結果が発行さ れた場合、当該専用命令を発行した命令解読手段を判別 行した命令解読手段を判別して、判別された命令解読手 20 して、判別された命令解読手段に対応する命令流の優先 度フィールドのうち現在の実行モード用の小フィールド の優先度を上げ又は下げるように構成してもよい。

> 【0097】この構成によれば、実行モード、例えばユ ーザモードとスーパーバイザモードとで独立して優先度 を設定するととができ、他のモードに移行してから復帰 した場合に元の優先度をそのまま保存することができ る。ととでマルチスレッドプロセッサは、さらに機能ユ ニットに1つが特定の命令を実行開始したことと、当該 特定命令の解読結果をどの命令解読手段が発行したかを 検出する特定命令検出手段と、特定命令の実行開始が検 出されたとき、その特定命令を発行した命令解読手段に 対応する命令流の優先度を予め定められた期間一時的に 変更する。その命令流の優先度は他の命令流よりも高い 優先度に変更される一時変更手段とを備えるように構成

> 【0098】との構成によれば、一時変更手段が一時的 に優先度を変更するので、命令流中の特定命令を先頭と する命令列を、連続したサイクルで実行することを保証 することができる。ここでマルチスレッドプロセッサ は、さらに命令流毎に他の命令流を排他的に停止状態に すべきか否かを示す排他停止データを保持する排他停止 データ保持手段とを備え、前配停止手段は、さらに前配 排他停止データにより停止状態とされている命令流に対 応する命令解読部から調停手段への命令発行要求の通知 を停止するように構成してもよい。

> 【0099】この構成によれば、ある命令流が他の命令 流の処理を強制的に停止させることができる。したがっ て命令流間の処理性能の調整を大きな範囲でおとなうと とができる。また、上記目的を達成するマルチスレッド

するマルチスレッドプロセッサであって、前配複数の命 令流の命令を一時記憶する命令キャッシュと、前記複数 の命令流に対応して設けられ、命令キャッシュから命令 流の命令をフェッチする複数の命令フェッチ手段と、前 記複数の命令流毎に優先度を指定する優先度指定手段 と、二以上の命令キャッシュ手段から同時に命令フェッ チ要求が出された場合には、前記優先度制御回路の優先 度に従って、命令フェッチ要求を調停する命令フェッチ 制御手段とを備える。

29

【0100】この構成によれば、命令キャッシュに対し 10 て複数の命令フェッチ手段からの命令フェッチ要求が競 合した場合に優先度に応じて調停するので、マルチスレ ッドプロセッサの上流の処理において、命令流毎の処理 性能を動的に調整することができるという効果がある。 また、上配目的を達成するマルチスレッドプロセッサ は、命令を実行する複数の機能ユニットと、命令キャッ シュから命令を取り出して解読し当該命令を実行すべき 機能ユニットを指定して命令発行要求を出力する複数の 命令解読部と、命令解読部と同数のレジスタセットを有 し、命令解聴部と同数の複数の命令流を同時かつ独立に 20 実行するマルチスレッドプロセッサであって、命令流中 の命令によって命令流毎に設定可能な、命令流の優先度 を保持する保持手段と、複数の命令流によって共有され る資源に対して、二以上の命令流が同時に競合した場合 に、前記優先度に従って調停する制御手段とを備え、前 記共有資源に対する競合は、一の機能ユニットに対する 二以上の命令解読部からの命令発行要求の競合、命令キ ャッシュに対する二以上の命令解読部からの命令取り出 し要求の競合、一のレジスタセットに対する二以上の機 能ユニットからのアクセス要求の競合の何れかであるよ 30 うに構成されている。

【0101】この構成によれば、命令流によって共有さ れる資源に対して複数の命令流からの処理要求が競合し た場合に、優先度に応じて調停するので、命令流毎の処 理性能を柔軟に調整することができるという効果があ る。

#### 【図面の簡単な説明】

【図1】本発明の実施形態におけるマルチスレッドブロ セッサの構成を示すブロック図である。

【図2】本発明の他の実施形態におけるマルチスレッド\*40 70

\*プロセッサのブロック図である。

【図3】本発明の実施形態における命令流制御装置の優 先顧位指定レジスタの説明図である。

【図4】同実施形態における命令流制御装置の優先順位 指定レジスタの下位2ピットの説明図である。

【図5】同実施形態における命令流制御装置の優先順位 指定レジスタの上位1ビットの説明図である。

【図6】同実施形態における命令流制御装置の内部割り 込みレジスタの構成図である。

【図7】同実施形態における命令流制御装置の排他停止 レジスタの構成図である。

【図8】同実施形態における命令発行判断部のより詳細 な構成例を示すプロック図である。

【図9】同実施形態における命令発行調停部のより詳細 な構成例を示すブロック図である。

【図10】同実施形態における優先順位判定部の制御論 理を示す説明図である。

【図11】同実施形態における命令発行禁止部のより詳 細な構成例を示すブロック図である。

【図12】機能ユニットによる専用命令及び制御レジス タの読み出し命令の実行内容を示す説明図を示す。

【図13】優先順位制御部の詳細な構成を示すブロック 図である。

【図14】連続サイクル優先部内のセレクタに入力され る選択信号と、出力値との関係を表した説明図を示す。

【図15】従来のマルチスレッドプロセッサの構成を示 すブロック図である。

#### 【符号の説明】

- 命令解読部 1
- 命令解読部 2
- 3 命令解読部

3.0

- 20 機能ユニットA
- 2 1 機能ユニットB
- 22 機能ユニットC
- 23 機能ユニットD
- 命令発行判断部 40
- 命令発行調停部 50

命令発行禁止部

- 60 優先順位制御部
- 命令選択部

[図3]

31 29 28 1211 98 65 MYID reserved PRI3 PRI2 PRI1 MYPRI 210 223 222 220

【図4】

| PRIx [1:0] | 意味      |
|------------|---------|
| 00         | lowest  |
| 01         | middle  |
| 10         | highest |
| 11         | highest |



【図5】

| PRIx [2] | 意味   |          | / 558 A 3 |             |
|----------|------|----------|-----------|-------------|
| 0        | 実行状態 |          | 【図6】      |             |
| 1        | 停止状態 | 31 29 28 |           | 3 2 1 0     |
|          |      | MYID     | reserved  |             |
|          | -    | 310      | •         | 322 321 320 |

【図7】

| 31 29 28 |          | 3210              |
|----------|----------|-------------------|
| MYID     | reserved | EXCL3 EXCL2 EXCL1 |
| 410      | . ————   | 422 421 420       |

【図8】





【図9】



【図10】

| (a) PR1'>PR2'>PR3'の場合          | (b) PR1'=PR2'>PR3'の場合  | (c) PR1'>PR2'=PR3'の場合 |
|--------------------------------|------------------------|-----------------------|
| ΔΔ 11(1 × 11(0 × 11(0 · × α) Ω | (2) 2212 ; 2012 2 2012 | (4)                   |

|    | 入力 |   | Γ | 出力  |     |
|----|----|---|---|-----|-----|
| 1A | 2A |   | 3 | 2A' | 3A' |
| 1  | 1  | 1 | ı | 0   | 0   |
| 1  | 1  | 0 | 1 | 0   | 0   |
| 1  | 0  | 1 | 1 | 0   | D   |
| 1  | 0  | 0 | 1 | 0   | 0   |
| 0  | 1  | 1 | o | 1   | 0   |
| 0  | 1  | 0 | 0 | 1   | 0   |
| Đ  | 0  | 1 | 0 | 0   | 1   |
| 0  | 0  | 0 | 0 | 0   | ٥   |

| 1A | 入力<br>1A 2A 3A |   |   | 出力<br>1A' 2A' 3A' |          |  |
|----|----------------|---|---|-------------------|----------|--|
| 1  | 1              | 1 | 1 | 0                 | 0        |  |
| 1  | 1              | 0 | 1 | 0                 | 0        |  |
| 1  | 0              | 1 | ı | 0                 | 0        |  |
| 1  | D              | 0 | 1 | 0                 | 0        |  |
| a  | 1              | ì | O | 1                 | <u>ا</u> |  |
| 0  | 1              | 0 | 0 | 1                 | 0        |  |
| 0  | 0              | 1 | 0 | 0                 | 1        |  |
| 0  | 0              | 0 | 0 | 0                 | 0        |  |

【図11】



【図13】



【図14】

| 選択信号                        |            | セレクタ 68の出力  |            |             |  |
|-----------------------------|------------|-------------|------------|-------------|--|
| 特定命令検出<br>コンパレータ 論理プロセッサ ID |            | PRI3" [1:0] | PRI2 [1:0] | PRI1' [1:0] |  |
| コンパレータ                      | 論理プロセッサ ID |             |            |             |  |
| =0                          | -          | PR13 [1:0]  | PRI2 [1:0] | PRII [1:0]  |  |
|                             | 3          | 11          | 00         | 00          |  |
| ≠0                          | 2          | 00          | 11         | OD          |  |
|                             | 1          | 00          | 00         | 11          |  |

【図15】



# This Page is Inserted by IFW Indexing and Scanning Operations and is not part of the Official Record

## **BEST AVAILABLE IMAGES**

Defective images within this document are accurate representations of the original documents submitted by the applicant.

Defects in the images include but are not limited to the items checked:

| ☑ BLACK BORDERS                                         |
|---------------------------------------------------------|
| ☐ IMAGE CUT OFF AT TOP, BOTTOM OR SIDES                 |
| ☐ FADED TEXT OR DRAWING                                 |
| ☑ BLURRED OR ILLEGIBLE TEXT OR DRAWING                  |
| ☐ SKEWED/SLANTED IMAGES                                 |
| ☐ COLOR OR BLACK AND WHITE PHOTOGRAPHS                  |
| ☐ GRAY SCALE DOCUMENTS                                  |
| ☑ LINES OR MARKS ON ORIGINAL DOCUMENT                   |
| ☐ REFERENCE(S) OR EXHIBIT(S) SUBMITTED ARE POOR QUALITY |
| □ OTHER.                                                |

# IMAGES ARE BEST AVAILABLE COPY.

As rescanning these documents will not correct the image problems checked, please do not report these problems to the IFW Image Problem Mailbox.